EDA : algorithme de désuffixation du langage médical
نویسندگان
چکیده
Pour améliorer l'efficacité des algorithmes de classification, il existe plusieurs algorithmes de préparation des données, dont la désuffixation. Cependant, le langage médical, et les comptes rendus hospitaliers sont rédigés dans un langage très technique, avec peu de formes flexionnelles. Nous nous sommes demandés si l'implémentation d'un algorithme de désuffixation dans ce contexte pouvait améliorer significativement les résultats obtenus. Nous avons mis en évidence qu'il était possible d'obtenir de meilleurs résultats que les algorithmes actuels d'une part en développant un algorithme spécifique basé sur un large corpus de documents, d'autre part en enrichissant ces derniers en fonction des racines lexicales des termes médicaux. Plusieurs algorithmes de désuffixation ont été proposés, les plus célèbres d'entre eux étant Porter (1980), Lovins (1968) et Paice (1996). Malheureusement, il s'agit d'algorithmes de désuffixation pour la langue anglaise, dont les dérivés morphologiques se prêtent facilement à ce type d'adaptation.
منابع مشابه
Violence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant
L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...
متن کاملConversion des Requêtes en Langage Naturel vers nRQL
Résumé. L’interrogation des bases de connaissances telles que les ontologies est une exigence centrale du web sémantique. De plus en plus on est forcé à reconnaître l’importance de fournir un accès simple à ces dépôts de connaissances. Cependant les outils existants qui permettent aux utilisateurs d’interroger et de raisonner sur les ontologies utilisent un langage de requête avec une syntaxe c...
متن کاملRecherche adaptative et contraintes musicales
RÉSUMÉ. Cet article présente un environnement de résolution de contraintes (CSP) musicales, basé sur le langage visuel OpenMusic. Nous présentons notamment une implémentation d’un algorithme de recherche locale, appelé recherche adaptative, dans le domaine musical. La recherche adaptative reprend le principe de résolution par optimisation d’une fonction de coût, mais en affinant la notion de co...
متن کاملOLAP : un pas vers la navigation
Dans le contexte de l'analyse OLAP, le concept de navigation n'a ja-mais été défini formellement. Nous montrons pourquoi cette lacune est préju-diciable. Nous proposons ensuite une formalisation du concept de navigation, ainsi qu'une première ébauche de langage de définition de navigations.
متن کامل